草庐IT

java - String.split 以分号分隔

全部标签

string - 内存中字符串去重

上下文:我正在写一些东西来处理日志数据,其中涉及将几GB的数据加载到内存中并交叉检查各种内容,查找数据中的相关性并将结果写入另一个文件。(这本质上是加载到Druid.io集群之前的cooking/非规范化步骤。)为了性能和代码简单性,我想避免将信息写入数据库——假设在可预见的future数据量一次处理可以通过给机器增加内存来处理。我的问题是尝试在我的代码中显式删除重复字符串是否是个好主意;如果是这样,什么是好的方法。这些日志文件中的许多值都是完全相同的文本片段(粗略估计,文件中总文本值的大约25%可能是唯一的)。由于我们谈论的是GB数据,虽然ram很便宜并且可以进行交换,但仍然存在限制

go - 如何设置 HTTP Post 实体,如 Java 的方法 HttpPost.setEntity

我是一名新的golang程序员。在java中,使用HTTP.setEntity()方法很容易设置。但在golang中,我有测试服务器的方式来设置它,但我们的服务器仍然缺少接收实体数据。这是代码:funcbathPostDefects(){url:="http://127.0.0.1/edit"varjsonStr=[]byte(`{"key":"abc","id":"110175653","resolve":2,"online_time":"2016-7-22","priority":1,"comment":"something.."}`)req,err:=http.NewReques

string - 使用 Go 截断 slice 的每个成员

我刚开始使用Go,在完成我想做的事情时遇到了一些麻烦。在加载一个大文本文件后,其中每一行都以我想要的单词开头,然后是我不关心的单空格和多空格分隔文本。我的第一行代码创建了一个行数组lines:=strings.Split(string(file),"\n")下一步将是截断每一行,我可以使用split语句来做到这一点。我确定我可以用for循环来做到这一点,但我正在尝试学习Go中的一些更有效的操作(与c/c++相比)我希望我能做这样的事情lines:=strings.Split((lines...),"")是否有更好的方法来做到这一点,或者我应该只使用某种类型的for循环?

regex - golang 如何使用正则表达式将字符串拆分为包含分隔符的 slice

我想将一个字符串拆分成一个片段,但想保留分隔符。有没有办法在golang中做到这一点?例如输入:"Hello!It's,a?beautiful$day*(todayandtomorrow).输出:[Hello|!|It's|,|a|?|beautiful|$|day|*|(|today|and|tomorrow|)|.]其中|代表元素的分离。有人可以帮忙吗? 最佳答案 您可以通过创建一个匹配单词或您的特殊字符之一的正则表达式来做到这一点。我不确切知道你的规则是什么,但考虑到输入和所需的输出,这是可行的:[A-Za-z']+|[*?(

go - 不能在赋值中使用 &dashUrl(类型 *[]byte)作为类型 *string

我正在尝试解析一个可能为空的表单帖子,如果是,我将更改变量。尝试使用*string类型。我遇到的问题是它不会为dashUrl转换,但会为start_time转换packagemainimport("encoding/base64""strconv""github.com/gocraft/web")typeYoutubeContextstruct{StartTime*float64`json:"start_time"`DashUrl*string`json:"dash_url"`}func(c*YoutubeContext)SetYoutubeContext(rwweb.Response

golang 从 net.TCPConn 中以 4 个字节作为消息分隔读取字节

我正在golang中开发SIPoverTCP模拟服务。传入的SIP消息由'\r\n\r\n'序列分隔(我现在不关心SDP)。我想根据该分隔符提取消息并将其发送到处理goroutine。通过golang标准库,我看不到实现它的简单方法。io和bufio包似乎没有一站式服务。目前我看到两个前进的选择(bufio):*Reader.ReadBytes函数,'/r'设置为分隔符。进一步的处理是通过使用ReadByte函数并将其与定界符的每个字节按顺序进行比较并在必要时取消读取它们来完成的(这看起来很乏味)将Scanner与自定义拆分功能结合使用,这看起来也不是太琐碎。我想知道是否还有其他更好的

string - 戈朗 : optimal sorting and joining strings

Thisgo源代码中的short方法有一条注释,暗示它没有以最佳方式分配内存。...coulddobetterallocation-wisehere...This是Join方法的源代码。这里到底分配了什么低效的东西?我看不到分配源字符串slice和目标字节slice的方法。源是键的slice。目的地是byteslice。 最佳答案 codereferencedbythecomment像写的那样是内存有效的。任何分配都在strings.Join中,这是为了最小化内存分配而编写的。我怀疑评论是不小心从这个codeinthenet/htt

java - 我将如何在 Java 中实现 Go 的无缓冲 channel ?

Go同时提供unbufferedandbufferedchannels用于goroutines(线程)之间的通信。是straightforward在Java中将缓冲channel实现为有界缓冲区。Go的无缓冲channel要求一个协程在另一个协程接收时发送。任何人都可以向我解释如何在Java中实现它吗? 最佳答案 在Java中你可以使用SynchronousQueue,Java8的源代码在这里http://grepcode.com/file/repository.grepcode.com/java/root/jdk/openjdk/

arrays - 为什么 Go 的 strings.Fields(str) 和 strings.Split(str, "") 这么慢?

我一直在测试Node和Go中的函数以比较它们的性能。几乎在每个测试中,Go都比Node快得多,除了使用strings.Fields()或strings.Split()时,Node是Node的2-3倍快。开始(2.14秒):start:=time.Now()varnewWords[]stringstr:="asdasjhfalsjdhalsdjhfadhfaldhfaljdhfaldhfasjdhfalsdhasdalsdhalksdhalksdhalksdalkjsdfadlkjdalkjdhasdhfefafad6a5a85dfas5da5dada6sd58ad5a8sd5f8as5

string - 二进制字符串转unicode

我不是100%确定为什么我的unicode二进制字符串不起作用..任何人都可以指出问题或帮助我修补它吗?另外,我将二进制文件分块的原因是它对于ParseInt来说太大而无法处理。有关示例,请参见下面的playground链接。funcbinToString(s[]byte)string{varcounterintchunk:=make([]byte,7)varbufbytes.Bufferfori:=ranges{ifi%8==0{counter=0ifi,err:=strconv.ParseInt(string(chunk),2,64);err==nil{buf.WriteStrin